تأثیر ساخت واژه ها در تجزیه وابستگی زبان فارسی

نویسندگان

مجتبی خلاش

mojtaba khallash بهروز مینایی بیدگلی

behrouz minaei-bidgoli

چکیده

سامانه های مبتنی بر داده به راحتی می توانند به سایر زبان ها یا دامنه ها منتقل شوند. استفاده از این رویکرد در تجزیه وابستگی منجر به ارائه روش های مبتنی داده شد که تنها نیازمند پیکره ای حاوی جملات و درخت وابستگی متناظر با آن به عنوان داده آموزشی است. الگوریتم های طراحی شده برای تجزیه وابستگی با وجود صحت بالا در زبان انگلیسی، بر روی دسته ای از زبان ها با افت صحت مواجه می شوند که دلیل این امر را می توان در پر رنگ تر بودن عامل بی ترتیبی و غنای ساخت واژی آنها دانست. این بدان معناست که سامانه های مبتنی بر داده نیازمند انتخاب خصوصیات و تنظیم دقیق پارامترها به منظور رسیدن به کارایی بهینه هستند. زبان فارسی که به تازگی پیکره وابستگی برای آن طراحی شده است جزو زبان هایی است که دو عامل بی ترتیبی و غنای ساخت واژی را داراست. در این مقاله سعی شده که عوامل تأثیرگذار بر کاهش صحت تجزیه وابستگی در زبان فارسی شناسایی و راهکارهایی برای بهبود صحت آن ارائه شود.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تأثیر ساخت‌واژه‌ها در تجزیه وابستگی زبان فارسی

Data-driven systems can be adapted to different languages and domains easily. Using this trend in dependency parsing was lead to introduce data-driven approaches. Existence of appreciate corpora that contain sentences and theirs associated dependency trees are the only pre-requirement in data-driven approaches. Despite obtaining high accurate results for dependency parsing task in English langu...

متن کامل

بررسی روش تکرار در ساخت واژه در زبان فارسی

سخنگویان هر زبانی بنا به نیاز بی‌وقفه خود برای انتقال مفاهیم و بیان ‌اندیشه‌ها و افکار و خواسته‌های خویش، واژگان جدیدی می‌آفرینند و در این فرایند، از توانایی‌های پیدا و پنهان زبان خود بهره می‌برند. برای نمونه، اشتقاقی بودن زبان عربی ‌باعث شده است تا اهل زبان بتوانند واژگان فراوانی با معانی متعدد از یک ریشه برسازند. انگلیسی زبانان هم از ویژگی اشتقاقی، ترکیبی ‌و پیوندی زبان خود برای خلق واژه استف...

متن کامل

شباهت واژه ها در زبان های فارسی و انگلیسی

زبان درختی می ماند که ریشه دارد و رشد می کند. شاخ و برگ تازه می یابد. رشد درخت زبان به دو شیوه اصلی صورت می گیرد یکی درونی، دیگری بیرونی یعنی با پیوند خوردن با شاخه و جوانه درخت دیگر. برخی این پیوند با بیرون را طبیعی نمی پندارند و با آن مخالفت می کنند. یکی از دلایل آنها این است که این تداخل می تواند ماهیت و طبیعت تنه اصلی زبان را از بین ببرد و در نتیجه رابطه وضعیت فعلی زبان با گذشته آن قطع شود....

متن کامل

بررسی روش تکرار در ساخت واژه در زبان فارسی

سخنگویان هر زبانی بنا به نیاز بی وقفه خود برای انتقال مفاهیم و بیان اندیشه ها و افکار و خواسته های خویش، واژگان جدیدی می آفرینند و در این فرایند، از توانایی های پیدا و پنهان زبان خود بهره می برند. برای نمونه، اشتقاقی بودن زبان عربی باعث شده است تا اهل زبان بتوانند واژگان فراوانی با معانی متعدد از یک ریشه برسازند. انگلیسی زبانان هم از ویژگی اشتقاقی، ترکیبی و پیوندی زبان خود برای خلق واژه استفاده...

متن کامل

طراحی هستان شناسیِ اصطلاحاتِ ساخت واژه در زبان فارسی

در چارچوب علوم رایانه و هوش مصنوعی، هستان شناسی سامانه ای رایانه ایینههای یۀ معین مانند اصطلاحات یۀ علمی را گردهم می آورد و روابط معنایی- مفهومیِ میی دهد. در این مقاله، ضمن معرفی مفهوم هستان شناسییم به سه پرسش پاسخ دهیم: 1). چه گونه می توان برای حوزۀ ساخت واژه در زبان فارسی، هستان شناسی تهیین هستان شناسیِ حوزۀ ساخت واژه در زبان فارسی و هستان شناسیِ اصطلاحات زبان شناسیِ گولد در زبان انگلیسی تاچه میز...

متن کامل

تکواژ «خانه» و عملکرد معنایی آن در ساخت واژه زبان فارسی

در این مقاله سعی برآن است تا در قالب ساختار واژه زبان فارسی به ویژگی های معنایی عملکرد تکواژ «خانه» در قیاس با سایر تکواژه های مکان ساز (مثل «ستان)» پرداخته شود. معمولاً در بررسی های ساخت واژه، چه در زبان فارسی و چه در متون غیر فارسی، عملکرد ساخت واژه در محدوده خاص خود مورد بررسی قرار می گیرد و غیر کوشش می شود تا بویژه گی های ساختی نحوی تکواژه ها در همنشینی با یکدیگر توجه گردد. مختصر حاضر با دید...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
پردازش علائم و داده ها

جلد ۱۱، شماره ۲، صفحات ۷۱-۸۰

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023